AI032
Programmazione di processori massivamente paralleli: un approccio pratico
Ottimizzazione della memoria e tiling della memoria condivisa
Obiettivi didattici
- Comprendere la gerarchia della memoria GPU e le caratteristiche di latenza
- Riconoscere i pattern per il coalescing della memoria globale
- Implementare strategie di tiling 1D e 2D utilizzando la memoria condivisa
- Analizzare e ridurre i conflitti delle banche della memoria condivisa
- Confrontare i guadagni prestazionali tra implementazioni con tiling e senza tiling